数学模型

Wang Haihua

🍈 🍉🍊 🍋 🍌


系统聚类法

系统聚类法是聚类分析方法中最常用的一种方法。它的优点在于可以指出由粗到细的多种分类情况,典型的系统聚类结果可由一个聚类图展示出来。

例如

在平面上有 7 个点 $w_1,w_2,w_3,w_4,w_5,w_6,w_7$(左图),可以用聚类图(右图) 来表示聚类结果。

exp 记 $\Omega=\left\{w_{1}, w_{2}, \cdots, w_{7}\right\}$,

聚类结果如下:当距离为 $f_5$时,分为一类 $$ G_{1}=\left\{w_{1}, w_{2}, w_{3}, w_{4}, w_{5}, w_{6}, w_{7}\right\} $$ 距离值为 $f_4$分为两类: $$ G_{1}=\left\{w_{1}, w_{2}, w_{3}\right\}, \quad G_{2}=\left\{w_{4}, w_{5}, w_{6}, w_{7}\right\} $$

距离值为$f_3$分为三类: $$ G_{1}=\left\{w_{1}, w_{2}, w_{3}\right\}, \quad G_{2}=\left\{w_{4}, w_{5}, w_{6}\right\}, \quad G_{3}=\left\{w_{7}\right\} $$

距离值为 $f_2$分为四类: $$ G_{1}=\left\{w_{1}, w_{2}, w_{3}\right\}, \quad G_{2}=\left\{w_{4}, w_{5}\right\}, \quad G_{3}=\left\{w_{6}\right\}, \quad G_{4}=\left\{w_{7}\right\} $$

距离值为 $f_1$分为六类: $$ G_{1}=\left\{w_{4}, w_{5}\right\}, G_{2}=\left\{w_{1}\right\}, G_{3}=\left\{w_{2}\right\}, G_{4}=\left\{w_{3}\right\}, G_{5}=\left\{w_{6}\right\}, G_{6}=\left\{w_{7}\right\} $$

距离小于 $f_1$分为七类,每一个点自成一类.

步骤

设$\Omega=\left\{w_{1}, w_{2}, \cdots, w_{7}\right\}$

(1)计算$n$ 个样本点两两之间的距离$\left\{d_{i j}\right\}$ ,记为矩阵$D=\left(d_{i j}\right)_{n \times n}$ ;

(2)首先构造$n$ 个类,每一个类中只包含一个样本点,每一类的平台高度均为零;

(3)合并距离最近的两类为新类,并且以这两类间的距离值作为聚类图中的平台高 度;

(4)计算新类与当前各类的距离,若类的个数已经等于 1,转入步骤 (5),否则,回到步骤 (3);

(5)画聚类图;

(6)决定类的个数和类。

如果使用最短距离法来测量类与类之间的距离,即称其为系统聚类法中的最短距离法(又称最近邻法),最长距离法同理。

参考资料